Dataset

Stars Name Feedback Gender Words
5 иван Качество огонь 177 см вес 77кг размер м в обтяжку M 10
5 Роман Футболка хорошего качества Плотный материал ткань хорошо окрашена Ворот плотный не растягивается M 12
5 Сергей <U+0001F643> M 1
5 Михаил Качественный принт размер в размер M 5
4 Игорь Немного длинноватая В плечах сила хорошо M 6
5 Эдуард Белый не белый чуть темнее чем на фото а так нормальная качество M 12
5 Ашот Все понравилось Достойная и качественная футболка за свои деньги M 9
5 Алексей <U+0001F44D><U+0001F3FF> M 1
5 Андрей Удобная качественная не садится M 4
5 Александр Моя любимая футболка Ткань отличная не вытягивается M 7

Summary

Stars Name Feedback Gender Words
Min. :1.00 Length:1070 Length:1070 Length:1070 Min. : 1.000
1st Qu.:5.00 Class :character Class :character Class :character 1st Qu.: 3.000
Median :5.00 Mode :character Mode :character Mode :character Median : 5.000
Mean :4.71 NA NA NA Mean : 7.698
3rd Qu.:5.00 NA NA NA 3rd Qu.:10.000
Max. :5.00 NA NA NA Max. :67.000

Visualization

Data analysis by gender

Summary

Gender vars n mean sd median trimmed mad min max range skew kurtosis se
F 1 805 8.452174 7.787237 6 7.093023 4.4478 1 63 62 2.197314 6.831933 0.2744640
M 1 265 5.407547 6.154570 3 4.356808 2.9652 1 67 66 4.683775 38.244775 0.3780722

Two Sample T-test

## 
##  Welch Two Sample t-test
## 
## data:  Words by Gender
## t = 4.6809, df = 512.78, p-value = 3.661e-06
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  1.596353 3.905534
## sample estimates:
## mean in group F mean in group M 
##        8.158491        5.407547

Feedback length distribution by gender

Data analysis by stars

Summary

Stars vars n mean sd median trimmed mad min max range skew kurtosis se
1 1 18 8.722222 6.133856 8 8.125000 5.9304 1 26 25 1.0487069 1.0078302 1.4457636
2 1 19 10.894737 7.866206 8 10.294118 5.9304 3 29 26 0.7787324 -0.6847929 1.8046314
3 1 44 9.727273 6.613459 8 8.944444 4.4478 1 27 26 1.1255796 0.3523331 0.9970165
4 1 93 10.311828 8.614925 8 8.640000 4.4478 1 48 47 2.1773128 5.1202484 0.8933261
5 1 896 7.238839 7.393406 5 5.896936 4.4478 1 67 66 2.7484058 12.0202307 0.2469963

Feedback length distribution by stars

Analysis of variance ANOVA

## Call:
##    aov(formula = Words ~ Starsf, data = review_test)
## 
## Terms:
##                   Starsf Residuals
## Sum of Squares   1218.52  59384.97
## Deg. of Freedom        4      1065
## 
## Residual standard error: 7.467298
## Estimated effects may be unbalanced
##               Df Sum Sq Mean Sq F value   Pr(>F)    
## Starsf         4   1219  304.63   5.463 0.000235 ***
## Residuals   1065  59385   55.76                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Tukey HSD post hoc test

##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Words ~ Starsf, data = review_test)
## 
## $Starsf
##           diff       lwr        upr     p adj
## 2-1  2.1725146 -4.538751  8.8837804 0.9026529
## 3-1  1.0050505 -4.703816  6.7139169 0.9890832
## 4-1  1.5896057 -3.664519  6.8437306 0.9223964
## 5-1 -1.4833829 -6.340734  3.3739679 0.9198970
## 3-2 -1.1674641 -6.768699  4.4337705 0.9794475
## 4-2 -0.5829089 -5.719883  4.5540651 0.9979941
## 5-2 -3.6558976 -8.386281  1.0744862 0.2156974
## 4-3  0.5845552 -3.148884  4.3179946 0.9930161
## 5-3 -2.4884334 -5.639084  0.6622169 0.1966216
## 5-4 -3.0729887 -5.295885 -0.8500919 0.0015675

Mean feedback length by the number of stars

General visualization of feedback length depending on the gender and the number of stars